智能论文笔记

EBHI-Seg: A Novel Enteroscope Biopsy Histopathological Haematoxylin and Eosin Image Dataset for Image Segmentation Tasks

Liyu Shi , Xiaoyan Li , Weiming Hua , Haoyuan Chen , Jing Chen , Zizhen Fan , Minghe Gao , Yujie Jing , Guotao Lu , Deguo Ma

分类：计算机视觉

2022-12-01

Background and Purpose: Colorectal cancer is a common fatal malignancy, the fourth most common cancer in men, and the third most common cancer in women worldwide. Timely detection of cancer in its early stages is essential for treating the disease. Currently, there is a lack of datasets for histopathological image segmentation of rectal cancer, which often hampers the assessment accuracy when computer technology is used to aid in diagnosis. Methods: This present study provided a new publicly available Enteroscope Biopsy Histopathological Hematoxylin and Eosin Image Dataset for Image Segmentation Tasks (EBHI-Seg). To demonstrate the validity and extensiveness of EBHI-Seg, the experimental results for EBHI-Seg are evaluated using classical machine learning methods and deep learning methods. Results: The experimental results showed that deep learning methods had a better image segmentation performance when utilizing EBHI-Seg. The maximum accuracy of the Dice evaluation metric for the classical machine learning method is 0.948, while the Dice evaluation metric for the deep learning method is 0.965. Conclusion: This publicly available dataset contained 5,170 images of six types of tumor differentiation stages and the corresponding ground truth images. The dataset can provide researchers with new segmentation algorithms for medical diagnosis of colorectal cancer, which can be used in the clinical setting to help doctors and patients.

translated by 谷歌翻译

Boosted Dynamic Neural Networks

Haichao Yu , Haoxiang Li , Gang Hua , Gao Huang , Humphrey Shi

分类：机器学习 | 计算机视觉

2022-11-30

Early-exiting dynamic neural networks (EDNN), as one type of dynamic neural networks, has been widely studied recently. A typical EDNN has multiple prediction heads at different layers of the network backbone. During inference, the model will exit at either the last prediction head or an intermediate prediction head where the prediction confidence is higher than a predefined threshold. To optimize the model, these prediction heads together with the network backbone are trained on every batch of training data. This brings a train-test mismatch problem that all the prediction heads are optimized on all types of data in training phase while the deeper heads will only see difficult inputs in testing phase. Treating training and testing inputs differently at the two phases will cause the mismatch between training and testing data distributions. To mitigate this problem, we formulate an EDNN as an additive model inspired by gradient boosting, and propose multiple training techniques to optimize the model effectively. We name our method BoostNet. Our experiments show it achieves the state-of-the-art performance on CIFAR100 and ImageNet datasets in both anytime and budgeted-batch prediction modes. Our code is released at https://github.com/SHI-Labs/Boosted-Dynamic-Networks.

translated by 谷歌翻译

PriorLane: A Prior Knowledge Enhanced Lane Detection Approach Based on Transformer

Qibo Qiu , Haiming Gao , Wei Hua , Gang Huang , Xiaofei He

分类：计算机视觉

2022-09-15

车道检测是自动驾驶中的基本模块之一。在本文中，我们采用了一种仅变压器的方法来进行车道检测，因此，它可以受益于完全视觉变压器的开发，并通过精细的 - 通过精细 - 通过精细 - 通过精细的 - 调整重量在大型数据集上进行全面训练。更重要的是，本文提出了一个名为Priorlane的新颖和一般框架，该框架用于通过引入低成本的局部先验知识来增强完全视觉变压器的分割性能。 PriorLane利用仅编码变压器来融合由预训练的分割模型与先验知识嵌入的功能融合。请注意，知识嵌入对齐（KEA）模块可通过对齐知识嵌入来提高融合性能。我们ZJLAB数据集的广泛实验表明，Prior-Lane以2.82％MIOU优于SOTA LANE检测方法，并且该代码将在以下位置发布：https：// github。 com/vincentqqb/priorlane。

translated by 谷歌翻译

MACAB: Model-Agnostic Clean-Annotation Backdoor to Object Detection with Natural Trigger in Real-World

Hua Ma , Yinshan Li , Yansong Gao , Zhi Zhang , Alsharif Abuadbba , Anmin Fu , Said F. Al-Sarawi , Nepal Surya , Derek Abbott

分类：计算机视觉

2022-09-06

对象检测是各种关键计算机视觉任务的基础，例如分割，对象跟踪和事件检测。要以令人满意的精度训练对象探测器，需要大量数据。但是，由于注释大型数据集涉及大量劳动力，这种数据策展任务通常被外包给第三方或依靠志愿者。这项工作揭示了此类数据策展管道的严重脆弱性。我们提出MACAB，即使数据策展人可以手动审核图像，也可以将干净的图像制作清洁的图像将后门浸入对象探测器中。我们观察到，当后门被不明确的天然物理触发器激活时，在野外实现了错误分类和披肩的后门效应。与带有清洁标签的现有图像分类任务相比，带有清洁通道的非分类对象检测具有挑战性，这是由于每个帧内有多个对象的复杂性，包括受害者和非视野性对象。通过建设性地滥用深度学习框架使用的图像尺度函数，II结合了所提出的对抗性清洁图像复制技术，以及在考虑到毒品数据选择标准的情况下，通过建设性地滥用图像尺度尺度，可以确保MACAB的功效。广泛的实验表明，在各种现实世界中，MacAB在90％的攻击成功率中表现出超过90％的攻击成功率。这包括披肩和错误分类后门效应，甚至限制了较小的攻击预算。最先进的检测技术无法有效地识别中毒样品。全面的视频演示位于https://youtu.be/ma7l_lpxkp4上，该演示基于yolov4倒置的毒药率为0.14％，yolov4 clokaking后门和更快的速度R-CNN错误分类后门。

translated by 谷歌翻译

Progressive Self-Distillation for Ground-to-Aerial Perception Knowledge Transfer

Junjie Hu , Chenyou Fan , Hua Feng , Yuan Gao , Tin Lun Lam

分类：计算机视觉

2022-08-29

我们研究了一个实用的问题，但尚未探讨问题：从不同飞行高度的角度来看，无人机如何在环境中感知。与始终从地面角度进行感知的自动驾驶不同，由于特定的任务，飞行无人机可能会灵活地改变其飞行高度，这需要能力才能使视点不变感知。为了减少飞行数据注释的努力，我们考虑了一种地面到意见知识蒸馏方法，同时仅使用地面视点的标记数据和飞行视点的未标记数据。为此，我们提出了一个渐进的半监督学习框架，该框架具有四个核心组成部分：一个密集的观点采样策略，将垂直飞行高度的范围分配为一组均匀分布的小部分，在每个高度下，我们采样了从该角度来看的数据；最近的邻居伪标记，以在前一个视点上学习的模型来注入最近的邻居视点的标签； MixView在不同观点之间生成增强图像以减轻观点差异；以及逐渐学习的渐进蒸馏策略，直到达到最大飞行高度为止。我们收集一个合成的数据集和一个现实世界数据集，我们进行了广泛的实验，以表明我们的方法为不同的飞行高度带来了有希望的结果。

translated by 谷歌翻译

Continual Machine Reading Comprehension via Uncertainty-aware Fixed Memory and Adversarial Domain Adaptation

Zhijing Wu , Hua Xu , Jingliang Fang , Kai Gao

分类：自然语言处理

2022-08-10

持续的机器阅读理解旨在逐步从连续的数据流中逐步学习，而无需访问先前的可见数据，这对于实际开发现实世界MRC系统至关重要。但是，在不忘记以前的知识的情况下，逐步学习新领域是一个巨大的挑战。在本文中，提出了MA-MRC，这是一个连续的MRC模型，具有不确定性感知的固定记忆和对抗域的适应性。在MA-MRC中，固定尺寸内存将少数样本存储在先前的域数据中，以及新域数据到达时不确定性的更新策略。对于增量学习，MA-MRC不仅通过学习记忆和新域数据来保持稳定的理解，而且还可以通过对抗性学习策略充分利用它们之间的域适应关系。实验结果表明，MA-MRC优于强基础，并且具有实质性的递增学习能力，而没有灾难性地忘记在两个不同的持续MRC设置下。

translated by 谷歌翻译

MLGOPerf: An ML Guided Inliner to Optimize Performance

Amir H. Ashouri , Mostafa Elhoushi , Yuzhe Hua , Xiang Wang , Muhammad Asif Manzoor , Bryan Chan , Yaoqing Gao

分类：人工智能 | 机器学习 | 神经与进化计算

2022-07-18

在过去的25年中，我们目睹了机器学习在编译器领域的广泛应用。选择和相位订购问题。但是，有限的作品已在最先进的编译器（即LLVM）上游，以将前者无缝集成到编译器的优化管道中，以便由用户容易部署。 MLGO是此类项目的第一个项目之一，它仅努力使用强化学习使用基于ML的INLINER来减少二进制的代码大小。本文介绍了mlgoperf；第一个端到端框架，能够使用LLVM的ML Inliner优化性能。它采用二级ML模型来生成用于训练重新定位的增强学习代理的奖励，该辅助剂以前由MLGO用作主要模型。它通过预测分析功能的函数的速度加速来做到这一点，并为主要模型提供快速训练框架，否则将是不切实际的。实验结果表明，MLGOPERF在LLVM在O3时的优化方面的优化分别为SPEC CPU2006和CBENCH基准分别获得了1.8％和2.2％。此外，提出的方法为我们的基准测试带来了自动点守则区域的26％，可以将其转化为额外的3.7％速度值。

translated by 谷歌翻译

CQC: A Crosstalk-Aware Quantum Program Compilation Framework

Fei Hua , Yuwei Jin , Yanhao Chen , Chi Zhang , Ari Hayes , Hang Gao , Eddy. Z Zhang

分类：自然语言处理

2022-07-12

近期量子系统嘈杂。串扰噪声已被确定为超导噪声中间尺度量子（NISQ）设备的主要噪声来源之一。串扰源于附近Qubits上的两Q量门门的并发执行，例如\ texttt {cx}。与单独运行相比，它可能会大大提高门的错误率。可以通过调度或硬件调整来减轻串扰。然而，先前的研究在汇编的后期很晚，通常是在完成硬件映射之后的。它可能会错过优化算法逻辑，路由和串扰的巨大机会。在本文中，我们通过在早期编译阶段同时考虑所有这些因素来推动信封。我们提出了一个称为CQC的串扰感知量子程序汇编框架，该框架可以增强串扰缓解，同时实现令人满意的电路深度。此外，我们确定了从中间表示向电路转换的机会，例如，以特定的特定串扰缓解措施，例如，\ texttt {cx}梯子构造在变异的量子eigensolvers（VQE）中。通过模拟和Real IBM-Q设备进行评估表明，我们的框架可以显着将错误率降低6 $ \ times $，而与最先进的门调度相比，仅$ \ sim $ 60 \％\％的电路深度方法。特别是对于VQE，我们使用IBMQ Guadalupe证明了49 \％的回路深度减少，而对H4分子的先前ART进行了9.6 \％的保真度改善。我们的CQC框架将在GitHub上发布。

translated by 谷歌翻译

CVR-LSE: Compact Vectorization Representation of Local Static Environments for Unmanned Ground Vehicles

Haiming Gao , Qibo Qiu , Wei Hua , Xuebo Zhang , Zhengyong Han , Shun Zhang

分类：机器人

2022-06-14

根据一般静态障碍物检测的要求，本文提出了无人接地车辆局部静态环境的紧凑型矢量化表示方法。首先，通过融合LiDAR和IMU的数据，获得了高频姿势信息。然后，通过二维（2D）障碍物点的生成，提出了具有固定尺寸的网格图维护过程。最后，通过多个凸多边形描述了局部静态环境，该多边形实现了基于双阈值的边界简化和凸多边形分割。我们提出的方法已应用于公园的一个实用无人驾驶项目中，典型场景的定性实验结果验证了有效性和鲁棒性。此外，定量评估表明，与传统的基于网格地图的方法相比，使用较少的点信息（减少约60％）来代表局部静态环境。此外，运行时间（15ms）的性能表明，所提出的方法可用于实时局部静态环境感知。可以在https://github.com/ghm0819/cvr_lse上访问相应的代码。

translated by 谷歌翻译

Analytical Composition of Differential Privacy via the Edgeworth Accountant

Hua Wang , Sheng Gao , Huanyu Zhang , Milan Shen , Weijie J. Su

分类：机器学习 | (统计)机器学习

2022-06-09

许多现代的机器学习算法由简单的私人算法组成；因此，一个越来越重要的问题是有效计算组成下的整体隐私损失。在这项研究中，我们介绍了Edgeworth会计师，这是一种分析方法，用于构成私人算法的差异隐私保证。 Edgeworth会计师首先使用$ f $ - 不同的隐私框架来无误地跟踪构图下的隐私损失，该框架使我们能够使用隐私损失log-logikelihoodhiehood（pllrs）表达隐私保证。顾名思义，该会计师接下来使用Edgeworth扩展到上下界限PLLR的总和的概率分布。此外，通过依靠一种使用简单的技术近似复杂分布的技术，我们证明了Edgeworth会计师可以应用于任何噪声加成机制的组成。由于Edgeworth扩展的某些吸引人的功能，该会计师提供的$（\ epsilon，\ delta）$ - 差异隐私范围是非反应的，基本上没有额外的计算成本，而不是先前的方法运行时间随成分的数量而增加。最后，我们证明了我们的上和下部$（\ epsilon，\ delta）$ - 差异隐私范围在联合分析和培训私人深度学习模型的某些制度中紧密。

translated by 谷歌翻译